结合ELM和非负矩阵分解的数据表示方法的研究与应用

结合ELM和非负矩阵分解的数据表示方法的研究与应用

作者:师大云端图书馆 时间:2022-05-08 分类:硕士论文 喜欢:1882
师大云端图书馆

【摘要】随着信息技术的快速发展,海量高维数据不断涌现,高维数据明显增加了计算,存储的代价,给机器学习,模式识别等提出严峻的挑战,如数据灾难。数据降维能有效地避免维数灾难,已经成为图像检索,模式识别,机器学习等领域的热点问题。其中非负矩阵分解(Non-negativeMatrixFactorization,NMF),是一种强大的数据降维工具,已经在机器学习(如分类,聚类问题)领域得到广泛使用。面对高维数据,无约束NMF需要花费大量的计算,运行速度慢。针对这一缺陷,QingHe提出的NMF结合ExtremeLearningMachine(ELM)特征映射的方法(EFMNMF)可以有效的减少NMF的计算量。然而以随机参数生成为基础的ELM特征映射是非线性的,这将会降低无约束的NMF生成的子空间中数据的表示能力。针对EFMNMF中数据表示能力降低的问题,本文提出一种改进的EFMNMF数据表示方法EFMGNMF。通过结合ELM特征映射与图正则化非负矩阵分解(GraphRegularizedNonnegativeMatrixFactorization,GNMF)的方法,在不降低NMF生成子空间中数据表示能力的情况下,有效减少NMF计算运行时间。在当前大数据环境下,Hadoop作为开源项目,是当前流行的云计算平台,其以HDFS和Mapreduce两项核心技术为基础。由于在单一节点下不能完成海量数据的存储和分析工作,本文详细分析了Hadoop分布式平台,在Mapreduce编程框架下,对EFMGNMF算法进行了并行化分析和实现。本文详细分析了EFMGNMF并行化中的两点:(1)Mapreduce框架下矩阵的相乘,详细介绍几种不同的矩阵相乘;(2)Mapreduce框架下GNMF中K近邻图矩阵的计算,一般的K近邻图矩阵计算在Mapreduce框架下时间复杂度高,本文将介绍一种近似K近邻的方法来构造K近邻图矩阵。本文将在Matlab环境下,用COIL20图片库,CMUPIE人脸数据库和TDT2文本数据库进行实验,对EFMGNMF的有效性进行分析。完成EFMGNMF的并行化,在Hadoop环境下对EFMGNMF的计算效率进行测试。
【作者】曾志勇;
【导师】蒋云良;刘勇;
【作者基本信息】杭州电子科技大学,计算机应用技术,2014,硕士
【关键词】非负矩阵分解;ELM;特征映射;图正则化非负矩阵分解;数据降维;Hadoop;Mapreduce编程框架;并行化;

【参考文献】
[1]龙胜春,尧丽君.行程长度纹理特征应用于肠癌病理图片识别[J].浙江工业大学学报,2015,01:110-114.
[2]韩艳红.冰相中2,4,5-三氯联苯的分布与释放规律研究[D].内蒙古农业大学,市政工程,2013,硕士.
[3]周长飞.小型化超宽带天线及其阵列研究[D].哈尔滨工业大学,电子与通信工程,2014,硕士.
[4]赵虹.具有标准发生率的SEIS传染病模型的全局稳定性研究[D].宁波大学,应用数学,2013,硕士.
[5]尤扬.基于计算机视觉的钢轨磨耗自动检测系统的研究[D].河北大学,通信与信息系统,2002,硕士.
[6]范培宏.基于石墨烯材料的防静电材料的制备与研究[D].合肥工业大学,2013.
[7]赵志强.基于CAN/3G技术的车载终端监控系统的设计与实现[D].哈尔滨工业大学,计算机科学与技术,2013,硕士.
[8]陈颖.基于情境感知的智慧校园体系及运营模式探究[D].北京交通大学,2014.
[9]冯丽娜.情绪智力、组织公平对工作绩效的影响研究[D].河北经贸大学,劳动经济学,2013,硕士.
[10]胡新波.基于ArcEngine的城市规划系统设计及实现[D].浙江大学,2006.
[11]张长征.嗜温耐砷浸矿细菌胞外聚合层中多糖的研究[D].东北大学,生物化工,2009,硕士.
[12]张娟.欧前胡素和异欧前胡素在大鼠体内的药代动力学研究[D].河北医科大学,药物分析学,2014,硕士.
[13]岳彩鹏.山东天业恒基股份有限公司东营业务竞争战略研究[D].山东大学,工商管理(专业学位),2013,硕士.
[14]叶琴.污水介质中的微生物腐蚀[D].华中科技大学,应用化学,2013,硕士.
[15]魏巍.K集团—矿薪酬体系设计研究[D].兰州大学,工商管理(专业学位),2013,硕士.
[16]张百海.河南与中部六省经济社会发展的比较研究[D].华中师范大学,情报学,2003,硕士.
[17]王珊珊,曾亮,叶理德.炼钢-连铸动态调度中基于规则的时间调整方法(待续)[J].冶金自动化,2014,04:21-24.
[18]向勇燕.当下“草根写作”话语研究[D].湖南师范大学,写作学,2013,硕士.
[19]魏勇.中国建设银行六安市分行小微企业信贷过程风险管理研究[D].安徽大学,工商管理,2012,硕士.
[20]韩振坤.基于地统计学的县域耕地质量监测样点布局研究[D].华中师范大学,土地资源管理,2014,硕士.
[21]张云鹏.焦化废水中氨氮的去除效果及影响因素研究[D].西安建筑科技大学,市政工程,2013,硕士.
[22]付祁远.清华同方股份有限公司知识管理战略研究[D].西安理工大学,工商管理,2003,硕士.
[23]翟蕾.《红高粱》中反讽话语的认知识解[D].西南大学,英语语言文学,2014,硕士.
[24]张玉华.供应链环境中两级库存管理研究[D].青岛大学,管理科学与工程,2004,硕士.
[25]鲍竣科,陈建,刘峰.决策支持系统在泵站改造中的应用前景初探[J].中国农村水利水电,2003,08:96-98.
[26]肖宏儒,宋卫东,朱志祥,朱锦彤.茶叶微波加工技术的研究[J].农业机械学报.2004(03)
[27]王兆湖,刘财,王建民,徐仲达,高振山,韩志琛.叠后地震信号透射损失的补偿[J].石油地球物理勘探,2008,02:217-221+127-128+246.
[28]朱建矿.游梁式抽油机系统动态特性的研究[D].西安理工大学,机械设计及理论,2004,硕士.
[29]何文凤.CRP诱导人脐静脉内皮细胞凋亡及阿托伐他汀的保护作用[D].川北医学院,内科学,2014,硕士.
[30]杨德伟,李俊源,姜献峰,饶聪超.基于ABAQUS的三维有限元抓握手模型的建立与研究[J].机械设计与制造工程,2013,01:18-21.
[31]刘程.北京长河滨水区空间形态演变及可持续发展策略研究[D].清华大学,城乡规划学,2013,硕士.
[32]赵宇.输入法界面风格编辑器的设计、实现与可用性评价[D].哈尔滨工业大学,软件工程,2014,硕士.
[33]金晓.基于图形化定制的语义搜索系统的设计与实现[D].山东大学,软件工程(专业学位),2012,硕士.
[34]范国增.华北石油管理局物探公司赴蒙古完成了第一口探井的地震测井任务[J].石油地球物理勘探,1995,05:592.
[35]张佳佳.我国存款准备金率变动对股票市场影响的实证研究[D].北京交通大学,2009.
[36]王韬.村民主体认知视角下乡村聚落营建的策略与方法研究[D].浙江大学,建筑设计及其理论,2014,博士.
[37]王敏.我国城市社区治理模式的路径探析[D].华中师范大学,公共管理,2013,硕士.
[38]蒋艳凰,周海芳,杨学军.监督学习的发展动态[J].计算机科学,2003,07:7-11.
[39]李华祥.高产孢白僵菌的发酵与茶叶病害虫防治[D].江南大学,发酵工程,2012,硕士.
[40]余照明.斯特林发动机活塞杆密封性能关键影响因素分析[D].兰州理工大学,机械制造及其自动化,2013,硕士.
[41]陈旭日.口服普萘洛尔治疗婴幼儿体表性血管瘤近期疗效及安全性的系统评价[D].广西医科大学,整形美容外科(专业学位),2013,硕士.
[42]隋川川.农信社利率定价管理系统的设计与实现[D].山东大学,软件工程(专业学位),2013,硕士.
[43]何经典.热轧主轧线数据自动采集系统研究及应用[J].冶金自动化,2010,03:53-56+70.
[44]钱少华.数据仓库及数据挖掘技术的应用的研究[D].江南大学,2004.
[45]缪彬.MIS的管理支持体系结构研究[D].昆明理工大学,2001.
[46]黄裕乔.动态交通诱导信息时空发布策略研究[D].北京交通大学,系统工程,2012,硕士.
[47]唐银清.基于改进内模控制的无线网络控制系统研究[D].海南大学,通信与信息系统,2014,硕士.
[48]沈嵘.网络信息计量学的研究及其应用[J].现代情报,2004,06:7-9.
[49]雍熙.平阳霉素治疗血管瘤临床研究—单中心21年治疗回顾性分析[D].川北医学院,外科学,2014,硕士.
[50]付志新.囊胚注射转基因ES细胞制作嵌合体的研究[D].甘肃农业大学,临床兽医学,2003,硕士.

相关推荐
更多